Recent advances in self-supervised visual representation learning have paved the way for unsupervised methods tackling tasks such as object discovery and instance segmentation. However, discovering objects in an image with no supervision is a very hard task; what are the desired objects, when to separate them into parts, how many are there, and of what classes? The answers to these questions depend on the tasks and datasets of evaluation. In this work, we take a different approach and propose to look for the background instead. This way, the salient objects emerge as a by-product without any strong assumption on what an object should be. We propose FOUND, a simple model made of a single $conv1\times1$ initialized with coarse background masks extracted from self-supervised patch-based representations. After fast training and refining these seed masks, the model reaches state-of-the-art results on unsupervised saliency detection and object discovery benchmarks. Moreover, we show that our approach yields good results in the unsupervised semantic segmentation retrieval task. The code to reproduce our results is available at https://github.com/valeoai/FOUND.
translated by 谷歌翻译
腿部运动中的弹簧基于弹簧的执行器可提供能量效率和提高的性能,但增加了控制器设计的难度。尽管以前的作品集中在广泛的建模和模拟上,以找到此类系统的最佳控制器,但我们建议直接在真实机器人上学习无模型控制器。在我们的方法中,步态首先是由中央模式发电机(CPG)合成的,其参数被优化以快速获得可实现有效运动的开环控制器。然后,为了使该控制器更强大并进一步提高性能,我们使用强化学习来关闭循环,以在CPG之上学习纠正措施。我们评估了DLR弹性四足动物BERT中提出的方法。我们在学习小跑和前进步态方面的结果表明,对弹簧执行动力学的开发自然而然地从对动态运动的优化中出现,尽管没有模型,但仍会产生高性能的运动。整个过程在真正的机器人上不超过1.5小时,并导致自然步态。
translated by 谷歌翻译
通过深度神经网络实现的A*算法的启发式函数的优化通常是通过最大程度地减少正方形根损失的目标成本估计值来完成的。本文认为,这不一定会导致对A*算法的更快搜索,因为其执行依赖于相对值而不是绝对值。作为缓解措施,我们提出了L*损失,该损失是A*搜索中过度扩展状态的数量上限。当用于优化最先进的深度神经网络的L*损失,用于在索科班等迷宫领域的自动化计划和带有传送的迷宫,可显着改善解决问题的比例,基础计划的质量,并降低扩大状态的数量达到约50%
translated by 谷歌翻译
我们讨论了多尺度Fisher对Gorsky和MA(2022)提出的多变量依赖的独立性测试,与基于Hilbert-Schmidt独立标准(HSIC)的现有线性时间内核测试相比。我们强调了这样一个事实,即在任何有限样本量的内核测试水平都可以得到准确控制,就像多率级别一样。在我们的实验中,我们观察到测试能力方面的一些性能限制。
translated by 谷歌翻译
我们使用最大平均差异(MMD),Hilbert Schmidt独立标准(HSIC)和内核Stein差异(KSD),,提出了一系列针对两样本,独立性和合适性问题的计算效率,非参数测试,用于两样本,独立性和合适性问题。分别。我们的测试统计数据是不完整的$ u $统计信息,其计算成本与与经典$ u $ u $统计测试相关的样本数量和二次时间之间的线性时间之间的插值。这三个提出的测试在几个内核带宽上汇总,以检测各种尺度的零件:我们称之为结果测试mmdagginc,hsicagginc和ksdagginc。对于测试阈值,我们得出了一个针对野生引导不完整的$ U $ - 统计数据的分位数,该统计是独立的。我们得出了MMDagginc和Hsicagginc的均匀分离率,并准确量化了计算效率和可实现速率之间的权衡:据我们所知,该结果是基于不完整的$ U $统计学的测试新颖的。我们进一步表明,在二次时间案例中,野生引导程序不会对基于更广泛的基于置换的方法进行测试功率,因为​​两者都达到了相同的最小最佳速率(这反过来又与使用Oracle分位数的速率相匹配)。我们通过数值实验对计算效率和测试能力之间的权衡进行数字实验来支持我们的主张。在三个测试框架中,我们观察到我们提出的线性时间聚合测试获得的功率高于当前最新线性时间内核测试。
translated by 谷歌翻译
人与机器人之间的双向对象移交可以在机器人以人为中心的制造或服务方面具有重要的功能技能。实现此技能的问题在于任何解决方案的能力来处理三个重要方面:(i)交接阶段的同步时间;(ii)对象的处理构成约束;(iii)理解触觉交换以无缝地实现(i)的某些步骤。我们为(i)和(ii)提出了一种新的方法,该方法包括在任务空间二次编程控制框架中明确制定移交过程作为约束,以实现隐式时间和轨迹相遇。我们的方法是在熊猫机器人手臂上实施的,从人类操作员那里拿走对象。
translated by 谷歌翻译
当今最先进的机器学习型号几乎无法审查。解释性方法的主要挑战是通过揭示导致给定决定的策略,通过表征其内部状态或研究基础数据表示来帮助研究人员开放这些黑匣子。为了应对这一挑战,我们开发了Xplique:一种用于解释性的软件库,其中包括代表性的解释性方法以及相关的评估指标。它与最受欢迎的学习库之一接口:Tensorflow以及其他图书馆,包括Pytorch,Scikit-Learn和Theano。该代码是根据MIT许可证获得许可的,可在Github.com/deel-ai/xplique上免费获得。
translated by 谷歌翻译
我们研究了基于内核Stein差异(KSD)的合适性测试的特性。我们介绍了一种构建一个名为KSDAGG的测试的策略,该测试与不同的核聚集了多个测试。 KSDAGG避免将数据分开以执行内核选择(这会导致测试能力损失),并最大程度地提高了核集合的测试功率。我们提供有关KSDAGG的力量的理论保证:我们证明它达到了收集最小的分离率,直到对数期限。可以在实践中准确计算KSDAGG,因为它依赖于参数bootstrap或野生引导程序来估计分位数和级别校正。特别是,对于固定核的带宽至关重要的选择,它避免了诉诸于任意启发式方法(例如中位数或标准偏差)或数据拆分。我们在合成数据和现实世界中发现KSDAGG优于其他基于自适应KSD的拟合优度测试程序。
translated by 谷歌翻译
学习一项难以捉摸的问题域的知情启发式功能是一个难以捉摸的问题。虽然有了已知的神经网络架构来代表这种启发式知识,但它不明显地了解了哪些具体信息以及针对理解结构的技术有助于提高启发式的质量。本文介绍了一种网络模型,用于学习一种能够通过使用注意机制通过最佳计划模仿与状态空间的遥远部分相互关联的启发式机制,这大幅提高了一种良好的启发式功能的学习。为了抵消制定难度越来越困难问题的方法的限制,我们展示了课程学习的使用,其中新解决的问题实例被添加到培训集中,反过来有助于解决更高复杂性的问题和远远超出所有现有基线的表演,包括古典规划启发式。我们展示了其对网格型PDDL结构域的有效性。
translated by 谷歌翻译
已经提出了几十年来捕获胶质瘤的生长,最常见的原发性脑肿瘤的反应扩散模型。然而,关于估计这些模型的初始条件和参数值的严重局限性将其临床用作作为个性化工具。在这项工作中,我们调查了深度卷积神经网络(DCNN)来解决现场遇到的缺陷的能力。基于从磁共振(MR)数据的磁共振(MR)数据产生的1,200种合成肿瘤,我们证明了DCNN在单个时间点仅从两个成像轮廓重建整个肿瘤细胞密度分布的能力。通过在先前时间点提取额外的成像轮廓,我们还证明了DCNN准确估计模型的各个扩散性和增殖参数的能力。从这些知识来看,最终可以使用该模型精确地捕获稍后时间点处的肿瘤细胞密度分布的时空演变。我们终于展示了我们对真正的胶质母细胞瘤患者的先生数据的适用性。这种方法可以打开反应扩散生长模型的临床应用的视角,用于肿瘤预后和治疗计划。
translated by 谷歌翻译